1
Resolviendo el problema de las alucinaciones: La metodología RAG de libro abierto
EvoClass-AI005Lecture 4
00:00

El principal obstáculo para usar la IA en entornos profesionales es el problema de alucinaciones. Esto ocurre cuando los modelos de lenguaje grandes (LLMs) confiadamente inventan hechos, fechas o citas porque se ven obligados a depender de patrones en sus datos de entrenamiento en lugar de información verificada en tiempo real.

1. De "libro cerrado" a "libro abierto"

La mayoría de los usuarios interactúan con la IA de forma "de libro cerrado", donde el modelo depende estrictamente de sus pesos internos (memoria). Para lograr una precisión de nivel profesional, pasamos a Generación Incrementada por Recuperación (RAG). Esta metodología de "examen de libro abierto" proporciona a la IA documentos específicos y relevantes para consultar antes de generar una respuesta.

2. El LLM como motor de razonamiento

En el marco de RAG, el LLM deja de actuar como una base de datos estática y comienza a funcionar como un motor de razonamiento. Cuando haces una pregunta, el sistema recupera pasajes relevantes desde tu "segunda mente" (tus PDFs y notas curadas) y los presenta como contexto. El rol del modelo cambia de "recordar de memoria" a "resumir y sintetizar los hechos proporcionados". Esto garantiza que la salida esté fundamentada en tus datos específicos, expresado por la lógica:

$$ \text{Respuesta} = \text{LLM}(\text{Consulta} + \text{Contexto}) $$

Flujo lógico de RAG
Question 1
Why do LLMs "hallucinate" in a professional context?
They are programmed to lie to the user.
They try to predict the next word based on outdated or insufficient training data.
They have too much access to real-time internet data.
Question 2
In the RAG methodology, what is the primary purpose of the "Context"?
To make the prompt longer and more expensive.
To provide a factual anchor that prevents the model from drifting into invention.
To teach the model a new language.
Challenge: Reducing Error Probability
Applying RAG principles to legal documents.
You need to use an AI to summarize a 50-page legal contract without it making up clauses.
Step 1
Identify the "Search Space" for the AI.
Solution:
Instead of asking general questions, upload the PDF to a RAG-enabled tool (like NotebookLM) to constrain the AI’s search space strictly to that specific document.